import pandas as pd

# 创建一个简单的DataFrame
data = {
    '姓名': ['张三', '李四', '王五', '赵六'],
    '年龄': [25, 30, 28, 35],
    '城市': ['北京', '上海', '广州', '深圳'],
    '薪资': [15000, 25000, 20000, 30000]
}

df = pd.DataFrame(data)
print("原始数据:")
print(df)
print("\n")

# 基本操作
print("数据基本信息:")
print(df.info())  # 显示数据结构
print("\n")

print("描述性统计:")
print(df.describe())  # 数值列的统计信息
print("\n")

# 数据筛选
print("年龄大于28的员工:")
print(df[df['年龄'] > 28])
print("\n")

print("薪资最高的员工:")
print(df.loc[df['薪资'].idxmax()])
print("\n")

# 添加新列
df['工龄'] = [3, 5, 4, 7]
print("添加新列后的数据:")
print(df)
print("\n")

# 数据分组统计
print("按城市分组的平均薪资:")
print(df.groupby('城市')['薪资'].mean())
print("\n")

# 保存到CSV文件
# df.to_csv('employee_data.csv', index=False)
# print("数据已保存到 employee_data.csv")
